from pyspark.context import SparkContext

# 1、创建spark的执行环境
sc = SparkContext(master="local", appName="WordCount")

# 2、读取数据
lines_rdd = sc.textFile("../../data/words")

# flatMap: 将rdd的数据一行一行传递给后面的函数,函数需要返回一个列表,flatmap会将每一行返回的列表展开
# flatMap: 传入一行返回多行

# 字符串底层是字符数组
words_rdd = lines_rdd.flatMap(lambda line: line.split(","))

words_rdd.foreach(print)
